Claude Mythos 意外泄露：Anthropic 最强模型强到不敢发

Liuwx2026-03-282026-03-28

前言

2026年3月27日，AI 圈迎来一场爆炸性消息——不是来自官方发布会，而是一场资料外泄事件。Anthropic（Claude 背后的公司）因为内容管理系统的配置失误，意外曝光了正在测试的最强新模型 Claude Mythos（代号 Capybara 🦫）。

这个模型在编程、推理、网络安全等方面全面碾压当前的顶配 Claude Opus 4.6，但 Anthropic 却迟迟不敢发布——因为它太强了，强到可能被黑客用于大规模网络攻击。

一、事件概述

（一）泄露经过

网络安全公司 LayerX Security 和剑桥大学研究人员发现，Anthropic 用于发布官博的内容管理系统（CMS）存在配置失误——所有上传的文件默认公开可访问。

结果，近 3000 份内部文件被公开"晒"在互联网上，包括博客草稿、图片、PDF，甚至一份员工育儿假文件。

《财富》杂志意外检索到一篇带有完整结构的博客草稿，曝光了 Claude Mythos 的存在。

（二）事件核心

泄露来源：Anthropic 官方 CMS 配置失误
发现者：LayerX Security + 剑桥大学研究人员
泄露文件：约 3000 份
核心内容：Claude Mythos（代号 Capybara）模型已完成训练

二、Claude Mythos 是什么？

（一）全新顶配层级

目前 Anthropic 的模型分为三档：

层级	定位	代表模型
Opus	顶配	Claude Opus 4.6
Sonnet	中配	Claude Sonnet 4
Haiku	入门	Claude Haiku

而 Capybara（Mythos） 是一个全新的、比 Opus 更强的档位：

“Capybara 是一个新的模型层级：比我们迄今最强的 Opus 系列更大、更智能——但同时也更贵。”

（二）命名玄机

“Capybara”（水豚🦫）打破了 Anthropic 传统的命名体系——Haiku、Sonnet、Opus 都是文学或音乐相关的词。这种刻意的断裂暗示：

这不是 Opus 的下一代，而是另一个层级的东西，不在原来的序列里。

（三）性能对比

能力维度	Claude Opus 4.6	Claude Mythos
软件编程	顶尖	✅ 显著提升
学术推理	顶尖	✅ 显著提升
网络安全	已能发现未知漏洞	🔴 远超任何模型
价格	最贵	更贵

三、为什么 Anthropic 不敢发布？

（一）网络安全能力过强

泄露文件指出：

“Mythos 在网络安全能力方面目前远超任何其他 AI 模型，它的存在预示着即将到来的一波 AI 模型浪潮，这些模型能够以远超防御方的速度发现和利用漏洞。”

换句话说：这个模型可能比现有的任何黑客工具都要厉害。

（二）攻击能力链

Mythos 在三个维度的提升，恰好构成完整的"攻击能力链"：

编程能力 → 理解系统、编写利用代码
    ↓
推理能力 → 规划攻击路径、绕过限制、逐步提权
    ↓
网络安全能力 → 发现漏洞、"钻空子"
    ↓
完整的网络攻击能力

（三）历史教训

Anthropic 曾披露，已有具备国家背景的黑客组织尝试利用 Claude 发起攻击。在一次事故中，对方借助 Claude Code 渗透了约 30 家机构（包括科技公司、金融机构和政府部门）。

四、Anthropic 的应对策略

（一）发布策略转变

以往大模型发布：先向开发者和普通用户开放，安全问题事后处理。

Mythos 发布策略：

1	先给网络安全防御机构 → 让他们提前加固系统 → 再考虑更广泛发布

这背后是一种相当直白的承认：这个模型对攻击方的潜在价值，可能大于对普通用户的价值。

（二）官方回应

Anthropic 在回应 Fortune 采访时确认：

“我们将这个模型视为一次**『阶跃式进化』**，是我们迄今构建的最强大的模型。”

五、更多爆料：高管闭门会

泄露文件还显示，Anthropic 将在英国举办闭门活动：

活动定位：小规模深度交流
目标人群：欧洲最具影响力的 CEO
出席人员：CEO Dario Amodei
活动内容：
  ├── 与政策制定者的圆桌讨论
  └── 体验尚未发布的 Claude 新功能

六、行业背景

（一）AI 网络安全能力竞赛

公司	模型	网络安全能力
OpenAI	GPT-5.3 Codex	首次标记为"高危能力"模型
Anthropic	Claude Opus 4.6	能在真实代码库中发现未知漏洞
Anthropic	Claude Mythos	🔴 远超以上所有模型

（二）IPO 时间线

据 The Information 消息，Anthropic 正在推进 IPO 计划，预计最快在今年第四季度上市。

七、待确认信息

⚠️ 以下信息需要进一步核实

[ ] Mythos 和 Capybara 是否为同一模型
[ ] 具体发布时间
[ ] 定价策略
[ ] 早期访问客户名单
[ ] CMS 是如何被配置错误的

八、参考资料

总结

这次泄露事件暴露了一个事实：当模型能力逼近现实系统边界时，AI 公司需要面对的已经不只是"能不能做出来"，而是"能不能安全地发布"。

Claude Mythos 的存在意味着 AI 模型的能力已经到达了一个新的临界点——强到连开发者自己都需要重新思考发布的节奏和方式。

关键看点：

✅ Claude Mythos 已完成训练，性能全面超越 Opus 4.6
✅ 网络安全能力过强，Anthropic 采取谨慎发布策略
✅ 命名"Capybara"暗示这是全新层级，非 Opus 继任者
⏳ 发布时间待定，可能先开放给网络安全防御机构

📌 本文基于公开泄露信息整理，部分细节可能随官方回应而更新。

整理时间：2026-03-28